Informationsextraktion durch Verwendung Computerlinguistischer Verfahren in Texten mit Makrostruktur

نویسندگان

  • Frank Reinert
  • Patrick Waldschmitt
  • Sandro Leuchter
  • Rainer Schönbein
چکیده

In diesem Beitrag wird ein System vorgestellt, mit dem semistrukturierte militärische Aufklärungsmeldungen analysiert werden können, um ontologiegestützt ein automatisches Szenenmodell aufzustellen. Im Rahmen der hier vorgestellten Studie wurde untersucht, in wie weit dazu das Open Source Natural Language Processing-Framework GATE eingesetzt werden kann. Ein GATE-basierter Prototyp wurde mit J2EE als Web-Service bereitgestellt und mit einer web-basierte Oberfläche zur Interaktion mit dem System und zur Visualisierung extrahierter Modelle versehen.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Korpuslinguistik - zu wissenschaftstheoretischer Grundlagen und methodologischen Perspektiven

Im Zusammenhang mit den folgenden Überlegungen steht der Terminus Korpuslinguistik für die Gesamtheit aller Tätigkeiten, die darauf gerichtet sind, (1) umfangreiches authentisches Sprachoder Textmaterial (gesprochen oder geschrieben) zu sammeln, zusammen zu stellen, aufzubereiten, mit Informationen zu annotieren, zu verwalten und zu warten sowie verfügbar zu machen, (2) solches Material für wis...

متن کامل

Interaktive Wissensextraktion und Wissenssuche

Die hochwertige Annotation von Entitäten und ihren Beziehungen ist ein Schlüssel zur Erschließung großer Textmengen, erfordert aber eine Kombination von effizienten maschinellen Verfahren und manueller Überprüfung. Darüber hinaus ist auch eine ausdrucksstarke Suche, die über eine reine Schlüsselwortsuche hinausgeht, von entscheidender Bedeutung. Dieser Artikel stellt die Knowledge Workbench vor...

متن کامل

Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion

Die Aufgabe der Informationsextraktion (IE) ist es, aus Texten einer Domäne gezielt die Informationen zu entnehmen, die gerade interessieren, und alle anderen zu überlesen (mehr z.B. bei Neumann 2004). Diese Aufgabe hat offensichtlich etwas mit der Fragebeantwortung (Question Answering) und mit dem themenoder fragespezifischen Zusammenfassen (Hintergrund dazu bei Afantenos et al. 2005, Endres-N...

متن کامل

Spektral modellierbare Lichtquelle zur Erzeugung beliebiger Spektren durch Einsatz eines "Digital Mirror Device"

Zusammenfassung. Die mehrkanalige bzw. multispektrale Bildgewinnung gewinnt zunehmend ein größeres Interesse vor allem in Bezug auf die spektrale Repräsentation der zu erfassenden Objekte. Die Kenntnis der spektralen Eigenschaften ermöglicht eine differenzierte farborientierte Verarbeitung der erzeugten Bilder. Neben der spektralen Erfassung von Vorlagen, die heute durch den Einsatz mehrkanalig...

متن کامل

Erkennung von Schreibern mittels handgeschriebener Buchstaben

Das Forschungsprojekt „Herbar Digital” [JKS00] startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierbögen (Herbarbelege) des Botanischen Museums Berlin. Da gelegentlich der Sammler der Pflanze unbekannt ist, wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um aus kursiv geschriebenen Buchstaben deren ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007